Introducción a R y RStudio

R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística

Percy Soto-Becerra M.D., M.Sc(c)

InkaStats Data Science Solutions | Medical Branch
@github/psotob91

Agosto 06, 2022

R y RStudio

R y RStudio


  • R es un lenguaje de programación estadística de código abierto.

  • R también es un entorno para computación estadística y gráfica.

  • Está potenciado con paquetes.

  • RStudio es una interfaz para R denominada IDE (integrated development environment).

  • RStudio no es un requerido para programar con R, pero es uno de los IDE más comúnmente utilizados.

  • Actualmente convirtiéndose en posit.

El problema de R: su aspecto


RStudio: el chasis del carro


En resumen, R y RStudio


En resumen, R y RStudio


Jerga básica de R


Objeto: Cualquier abstracción en R. Los datos son objetos en R.


Función: Código capaz de realizar una acción específica con los datos. También es un objeto: un objeto que actúa sobre otros objetos.


Paquetes: Library en inglés. Conjunto de funciones que realizan acciones a menudo relacionadas en R.


Paquetes de R base: Conjunto de paquetes instalados por defecto en R.


Paquetes de R tidy: Conjunto de paquetes que siguen el estilo tidy en R.

Paquetes de R


  • Los paquetes son las unidades fundamentales del código reproducible en R.

  • Al 13 de junio de 2022, hay 18 560 paquetes disponibles.

  • ¡Trabajaremos con un pequeño (pero importante) conjunto de estos!

  • Cada paquete contiene una o más funciones que ejecutan tareas.

  • ¡Hay paquetes de todo tipo y para todos los gustos!

R y sus paquetes


En resumen: R, RStudio y sus paquetes


tidyverse


tidyverse.org


  • Tidyverse es una colección grande de paquetes de R diseñados para hacer ciencia de datos.

  • Todos los paquetes comparten una filosofía subyacente y una gramática común.

  • R, como todo lenguaje, tiene varios dialectos.

  • Dos dialectos predominan: R base y R tidy.

  • R tidy se basa en la filosofía de tidyverse.

  • Usaremos este enfoque predominantemente y R base cuando no tenga remplazo o sea más sencillo usarlo.

Aspectos elementales de R y Rstudio

Ventanas de RStudio


Código en scripts de R


  • El código se escribe en el Script, pero no se imprime.

  • Los resultado se imprimen en la consola.

  • Aunque es útil usar la consola, es preferible usar herramientas de programación literaria: RMarkdown o Quarto.

R Markdown y Quarto


rmarkdown.rstudio.com


  • rmarkdown y quarto permiten a los usuarios de R escribir su código y prosa en documentos computacionales reproducibles.

  • Por lo general, nos referimos a documentos R Markdown con la extensión .Rmd y a los documentos Quarto con la extensión .qmd.

Archivo R Markdown (.Rmd) a PDF

R Markdown evolucionó a Quarto


  • Recientemente, RStudio presentó Quarto: https://quarto.org/.
  • Es la versión mejorada de RMarkdwon.
  • Si usaste RMarkdown, puedes ejecutar tus códigos en Quarto sin ningún problema.
  • Quarto permite ejecutar código Python, Julia y Observable.

R Markdown y Quarto son muy flexibles


  • Herramientas de programación literaria:

    • Legibles para la computadora y para el ser humano.
  • Útiles para alcanzar reproducibilidad.

  • También muy útiles para diversas actividades académicas:

    • Presentaciones académicas

    • Artículos científicos

    • Diseño de blogs, web u otra herramienta de difusión de conocimiento.

Programación Literaria


¿Cómo usaremos Quarto?


  • Cada ejercicio / reporte / proyecto / tarea / etc. será hecho en un documento R Markdown aumentado: Quarto.

  • Siempre te proporcionaremos una plantilla de documento Quarto para iniciar.

  • Las plantillas irán modificándose conforme avancemos el curso.

  • Las plantillas son simplemente eso, plantillas, para usarlas en su día a día no necesita pensar mucho en ellas ni entenderlas a detalle.

  • Yo entiendo menos del 20% de estas y aún así me sirven mucho para mi trabajo diario. ¡Sugiero comenzar haciendo lo mismo!

Partes de un documento Quarto / R Markdown